2 research outputs found

    Computational Methods for Detecting Large-Scale Chromosome Rearrangements in SNP Data

    Get PDF
    Large-scale chromosome rearrangements such as copy number variants (CNVs) and inversions encompass a considerable proportion of the genetic variation between human individuals. In a number of cases, they have been closely linked with various inheritable diseases. Single-nucleotide polymorphisms (SNPs) are another large part of the genetic variance between individuals. They are also typically abundant and their measuring is straightforward and cheap. This thesis presents computational means of using SNPs to detect the presence of inversions and deletions, a particular variety of CNVs. Technically, the inversion-detection algorithm detects the suppressed recombination rate between inverted and non-inverted haplotype populations whereas the deletion-detection algorithm uses the EM-algorithm to estimate the haplotype frequencies of a window with and without a deletion haplotype. As a contribution to population biology, a coalescent simulator for simulating inversion polymorphisms has been developed. Coalescent simulation is a backward-in-time method of modelling population ancestry. Technically, the simulator also models multiple crossovers by using the Counting model as the chiasma interference model. Finally, this thesis includes an experimental section. The aforementioned methods were tested on synthetic data to evaluate their power and specificity. They were also applied to the HapMap Phase II and Phase III data sets, yielding a number of candidates for previously unknown inversions, deletions and also correctly detecting known such rearrangements.Ihmisten perimissä on yksilöllistä vaihtelua. Tämä vaihtelu voi olla useaa eri tyyppiä. Esimerkiksi yksittäisiä emäspareja koskettavat pistemutaatiot ovat usein helposti ja halvasti mitattavissa. Perimä voi kuitenkin vaihdella myös suuremmalla mittakaavalla. Osa perimästä voi olla joissakin tapauksissa kääntynyt toisin päin tai saattaa puuttua kokonaan; edellistä vaihtelutyyppiä kutsutaan inversioksi ja jälkimmäistä deletioksi. Inversioiden ja deletioiden tunnistaminen perimästä ei ole yhtä helppoa kuin pistemutaatioista seuranneiden SNP:ien (single nucleotide polymorphism) mittaaminen. Tässä väitöstyössä on kehitetty menetelmiä, jotka pyrkivät tunnistamaan inversioiden ja deletioiden jälkiä SNP-aineistoista. Menetelmien tavoitteena on ohjeistaa, mitä alueita perimästä on syytä tarkastella muilla tarkemmilla, mutta kalliimmilla, keinoilla tällaisten suurten perimämuutosten tunnistamiseksi. Väitöstyössä esitetään myös tietokoneohjelma, joka tuottaa inversion sisältäviä synteettisiä SNP-aineistoja. Tämän ohjelman avulla tarkastellaan eri inversiontunnistusmenetelmien toimivuutta erilaisissa koetilanteissa. Kokeiden mukaan tietynlaiset inversiot tunnistuvat kehitetyllä menetelmällä hyvin. Kehitettyjä menetelmiä sovellettiin useasta eri ihmispopulaatiosta kerätyn Hapmap-aineiston analysointiin. Tuloksena menetelmät antoivat jo aiemmin tunnettuja inversioita ja deletioita sekä uusia ehdokasalueita kokeellista validointia varten
    corecore